큰 언어 모델(LLM)을 영리하지만 전공이 넓은 학자로 상상해 보세요. 이 일반적인 학자를 임상 방사선 전문가나 계약 법률 전문가와 같은 전문가로 바꾸기 위해 우리는 모델 적응의 스펙트럼을 탐색하게 됩니다. 이 스펙트럼은 제로샷 프롬프팅에서 깊은 신경망 수정으로의 전환 방식을 정의하며, 하드웨어 제약과 최첨단(상위 수준, SOTA) 최고 성능 결과를 달성하는 데의 균형을 맞춥니다.
주요 적응 방식
- 컨텍스트 내 학습 (ICL): 모델은 "고정된 상태"로 유지됩니다. 프롬프트 내 예시를 관찰함으로써 $P(y|x)$를 추정하도록 학습합니다. 속도는 빠르지만, 높은 변동성과 환각 현상에 자주 노출됩니다.
- 일치성 및 안정성: 생산 수준의 신뢰성을 달성하려면 스펙트럼의 오른쪽으로 이동해야 합니다. 미세조정은 지침과 실제 결과 사이의 사람의 판단과의 일치성 지표 패턴에서 벗어난 경우를 명확히 처벌함으로써 더 나은 일치성을 제공합니다.
- 최첨단 목표: 최고 수준의 성능을 달성하기 위해서는 다양한 선택 사항을 고려해야 합니다. 전체 미세조정은 최대한의 제어력을 제공하지만, '비극적 망각'이라는 위험을 안고 있으며, 반면 PEFT(매개변수 효율적 미세조정) 하드웨어 친화적인 중간 해결책을 제공합니다.
실제 사례
의료 보조 시스템을 생각해 보세요. ICL을 사용하면, 프롬프트에 증상-진단 예시 3개를 제공합니다. 반면, 미세조정을 사용하면 5만 건의 의료 기록을 기반으로 모델을 훈련시킵니다. 후자의 결과는 임상 용어를 본질적으로 이해하고, 훨씬 더 높은 일관성과 안정성을 보입니다.